期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于top- k显露模式的商品对比评论分析
刘璐, 王怡宁, 段磊, Jyrki Nummenmaa, 晏力, 唐常杰
计算机应用    2015, 35 (10): 2727-2732.   DOI: 10.11772/j.issn.1001-9081.2015.10.2727
摘要499)      PDF (994KB)(374)    收藏
随着电子商务的发展,许多购物网站都提供商品评论作为用户购物的决策参考。由于商品评论具有海量、冗余、不规范的特点,用户难以在短时间内浏览所有商品评论,更难以基于评论内容发现商品对比特征。对此,设计了top- k显露模式挖掘算法,并将此算法应用于商品评论对比分析,实现了用户购物决策支持系统——ReviewScope。ReviewScope能够从不同商品的评论中发现特定商品的对比评论,并以此作为购物决策可视化地提供给用户。基于京东商城真实商品评论数据的实验结果表明ReviewScope具有有效、灵活、用户友好的特点。
参考文献 | 相关文章 | 多维度评价
2. 基于语义规则的Web金融文本情感分析
吴江 唐常杰 李太勇 崔亮
计算机应用    2014, 34 (2): 481-485.  
摘要880)      PDF (922KB)(1530)    收藏
为有效提高非结构化Web金融文本情感倾向和强度分析的精度,提出了基于语义规则的Web金融文本情感分析算法(SAFT-SR)。该算法基于Apriori算法对金融文本进行属性抽取,构建金融情感词典和语义规则识别情感单元及强度,进而得到文本的情感倾向和强度。实验结果表明,与Ku提出的算法相比,在情感倾向分类方面,算法SAFT-SR情感分类性能良好,提高了分类器的F值、查全率和查准率;在情感强度计算方面,算法SAFT-SR的误差更小,更接近真实评分,证明了SAFT-SR是一种有效的金融文本情感分析算法。
相关文章 | 多维度评价
3. 基于稀疏贝叶斯学习的个人信用评估
李太勇 王会军 吴江 张智林 唐常杰
计算机应用    2013, 33 (11): 3094-3096.  
摘要849)      PDF (609KB)(426)    收藏
针对传统信用评估方法分类精度低、特征可解释性差等问题,提出了一种使用稀疏贝叶斯学习方法来进行个人信用评估的模型(SBLCredit)。SBLCredit充分利用稀疏贝叶斯学习的优势,在添加的特征权重的先验知识的情况下进行求解,使得特征权重尽量稀疏,以此实现个人信用评估和特征选择。在德国和澳大利亚真实信用数据集上,SBLCredit方法的分类精度比传统的K近邻、朴素贝叶斯、决策树和支持向量机平均提高了4.52%,6.40%,6.26%和2.27%。实验结果表明,SBLCredit分类精度高,选择的特征少,是一种有效的个人信用评估方法。
相关文章 | 多维度评价
4. 基于多线程评估的基因表达式编程算法
倪胜巧 唐常杰 杨宁 左劼
计算机应用    2012, 32 (04): 986-989.   DOI: 10.3724/SP.J.1087.2012.00986
摘要1457)      PDF (584KB)(506)    收藏
分析了基因表达式编程(GEP)算法的性能关键,指出提升的一个重要瓶颈是在个体评估阶段;结合多核CPU并行计算能力,提出了基于多线程评估的GEP算法(MTEGEP),并通过实验验证了MTEGEP的高效性:在双核CPU环境下MTEGEP运算速度是传统GEP的1.89倍,而在8核CPU环境下达到了6.48倍。实验结果表明该算法能有效提升GEP算法的性能。
参考文献 | 相关文章 | 多维度评价
5. 基于显露模式的对比挖掘研究及应用进展
段磊 唐常杰 Guozhu Dong 杨宁 苟驰
计算机应用    2012, 32 (02): 304-308.   DOI: 10.3724/SP.J.1087.2012.00304
摘要1326)      PDF (945KB)(609)    收藏
对比挖掘是近年来数据挖掘领域的新热点之一。对比挖掘关注并描述不同类别和条件下,或随时间变化的知识,旨在设计能够发现刻画数据集中不同类别或条件的样本间差异的模式或模型的方法。由于对比挖掘技术能化繁为简、准确分类,在实践中得到广泛应用。显露模式的挖掘和应用是对比挖掘的重要分支。综述了显露模式的背景、基本概念和原理,分析了显露模式的挖掘方法,讨论了显露模式的扩展定义和挖掘,介绍了基于显露模式的分类器构造方法,展示了显露模式的若干实际应用,展望了基于显露模式的对比挖掘的未来研究。
参考文献 | 相关文章 | 多维度评价
6. 基于显露模式的出生缺陷判别算法
吴保华 段磊 于中华 唐常杰 朱军
计算机应用    2011, 31 (04): 885-889.  
摘要1442)      PDF (767KB)(469)    收藏
出生缺陷是目前世界各国关注的公共卫生问题,采用数据挖掘技术提高出生缺陷的诊断水平是当前数字医学的热点研究方向。为此,提出了适合出生缺陷特征提取的两种显露模式:有缺陷相比于无缺陷的显露模式和无缺陷相比于有缺陷的显露模式。将新模式与决策树C4.5算法结合,实现了基于显露模式的出生缺陷判别(BDD-EP)算法。实验结果表明BDD-EP算法判别准确率高达90.1%,判别正常类的F度量值为93.9%,判别缺陷类的F度量值为74.1%,均高于其他几种著名的分类算法的判别效果。
相关文章 | 多维度评价
7. 基于干预规则挖掘因果关系与分段干预事件及对比不等式
唐常杰 段磊 郑皎凌 杨宁 王悦 朱军
计算机应用    2011, 31 (04): 869-873.   DOI: 10.3724/SP.J.1087.2011.00869
摘要1403)      PDF (819KB)(663)    收藏
为揭示亚复杂系统(SCS)在干预下的特殊行为,提出了对比不等式概念,提出并实现了分段干预规则的挖掘算法;通过在亚复杂系统中施加扰动式干预并分析其动力学效应,提出并实现了基于扰动因果关系挖掘算法。在真实数据上的实验表明,分段干预规则发现了传统挖掘方法难以发现的新干预事件,因果挖掘算法发现了传统方法难以发现的因果关系。
相关文章 | 多维度评价
8. 干预规则挖掘的任务分类和三项技术进展
唐常杰 段磊 王悦 杨宁 朱军 代礼
计算机应用    2010, 30 (1): 10-14.  
摘要1806)      PDF (830KB)(1020)    收藏
介绍了亚复杂系统中干预规则的基本概念和挖掘方法,提出了干预规则挖掘技术的分类准则,综述了三项干预规则挖掘技术的最新进展,包括疾病状态干预技术、基于数据流的未知干预发现技术和基于并行事件序列的干预规则挖掘。在实践基础上分析了干预规则挖掘的难点,展望了进一步的研究工作。
相关文章 | 多维度评价
9. 无表达式树的基因表达
李川 唐常杰 陈瑜 邱江涛 罗谦 吴江 朱军
计算机应用   
摘要1358)      PDF (1044KB)(935)    收藏
传统基因表达式编程(GEP)进行基因表达时,动态生成释放大量表达式树(ET),成为GEP的性能瓶颈。提出基于Scale的基因表达算法解决此问题。Scale是一个约束线性表。由于Scale支持一次创建,永久使用,而无须更多维护。所以把基因表达至Scale中避免了ET的动态生成和释放。实验结果表明,在多数情况中,基于Scale的基因表达较基于ET的基因表达快6~10 倍。
相关文章 | 多维度评价
10. 亚复杂系统中动力学干预规则挖掘技术研究进展
唐常杰 张悦 唐良 李川 陈瑜
《计算机应用》唯一官方网站    2008, 28 (11): 2732-2736.  
摘要2128)      PDF (1155KB)(1344)    收藏
亚复杂系统干预规则挖掘是数据挖掘领域的新内容。综述了亚复杂系统干预规则研究背景和典型问题,通过实例,描述了干预规则挖掘领域一些基本概念和术语,如干预相关度、传递相关度、干预分型和干预代数等;介绍了在亚复杂系统干预规则挖掘的初步探索和成果,包括关于朴素干预规则和数值型干预规则挖掘算法,以及基于密度的数据流干预分析模型及相关结果。
相关文章 | 多维度评价
11. 基于基因表达式编程的信用评估模型挖掘方法
吴江 唐常杰 段 磊 李太勇
计算机应用   
摘要2187)      PDF (757KB)(1114)    收藏
提出了一种基于基因表达式编程(GEP)的信用评估模型挖掘方法GEP-CREDIT。该方法基于客户信贷数据,利用GEP算法自动进行属性筛选,并进行属性融合,在此基础上训练和建立信用评估模型。在德国信用数据库真实数据集上做的实验和性能分析表明,基于GEP的信用评估模型挖掘方法较Nave Bayes算法的预测精度提高了3%;较SVM算法的预测精度提高了1.6%;较KNN(K=17)算法的预测精度提高了6.83%。
相关文章 | 多维度评价
12. 基于属性归纳的中药方剂数据挖掘
刘齐宏 唐常杰 李川 刘齐巍 曾涛 蒋永光
计算机应用   
摘要1737)      PDF (1071KB)(881)    收藏
传统的面向属性归纳技术(AOI)存在概化粗糙及算法效率较低等缺陷。为适应中药方剂数据挖掘的复杂需求,提出基于中药数据驱动的属性关联概化算法;为关联的维度创建概念树,利用关联属性与基准属性的相关性以提高归纳的效率,实现了面向属性关联归纳的数据挖掘系统TCMDBMiner。实验结果表明,新算法较传统算法的归纳概化效率提高了23%以上,挖掘结果符合中医理论。
相关文章 | 多维度评价
13. 基于转基因GEP 的公式发现
唐常杰 陈瑜 张欢 段磊
计算机应用   
摘要1762)      PDF (704KB)(1117)    收藏
在传统基因表达式编程(GEP)挖掘知识的过程中,用户只能被动等待程序连续进化若干代之后给出的结果,因此难以有效干预进化过程、质量和速度。为解决这一问题,把生物工程转基因思想引入到基于GEP的函数挖掘中,获得了一系列成果。综述了基于转基因技术的GEP研究进展,包括基因注入,转基因过程和进化干预等,通过自然选择与人工选择的融合,在一定程度上引导进化向着人们预期的方向进行。
相关文章 | 多维度评价
14. 社会网络分析和社团信息挖掘的三项探索——挖掘虚拟社团的结构、核心和通信行为
唐常杰 刘威 温粉莲 乔少杰
计算机应用   
摘要2154)      PDF (827KB)(2401)    收藏
社会网络分析是数据挖掘的新热点。文中综述了社会网络分析研究动态,介绍了作者近期在社会网络挖掘方面的三项探索,包括:(a)虚拟社团的结构挖掘,讨论了初始社团生成、权重计算,社团树生成和社团结构挖掘算法。(b) 基于六度分割和最短路径社团核心成员挖掘,讨论了计算节点间的最短路径,根据六度分割定理的剪枝,基于SPLINE算法和中心度挖掘犯罪子团伙中的核心的技术。(c)基于用户属性的通信行为挖掘,讨论了用户个性和通信行为关系的量化描述,采用911事件解密数据来建立社会网络,用于模拟恐怖分子间邮件的收发。
相关文章 | 多维度评价
15. 基于基因表达式编程挖掘中医方证关系
余弦;唐常杰;张欢; 乔少杰; 蒋永光; 刘娟; 韩佩玉
计算机应用    2005, 25 (11): 2679-2680.  
摘要1350)      PDF (499KB)(1319)    收藏
为解决中医方-证关系的函数挖掘的特殊困难,提出了基于基因表达式编程的新方法。针对中医学方证数据的特点提出结构简单、高效,占用空间少的主次分离指针编码。提出基于罚函数的单方适应度值计算和基于相似度的中医学症状组平均相似度函数,实现了基于基因表达式的方证关系函数发现算法MRAGEP,获得了一个方证函数,不但有很好的精度, 而且符合中医主次证原理,可解释性好。实验证明了算法的正确性和有效性,正确率达到了62.5%。
相关文章 | 多维度评价
16. 基于基因表达式编程的知识发现的三项新技术——转基因,重叠基因表达和回溯进化
唐常杰,彭京,张欢,钟义啸
计算机应用    2005, 25 (09): 1978-1981.   DOI: 10.3724/SP.J.1087.2005.01978
摘要1092)      PDF (227KB)(1079)    收藏
介绍了在研发基于基因表达式编程(GEP)的知识发现的三项新技术,包括:(a)转基因技术,通过注入转基因,引导进化方向,控制知识发现过程;(b)重叠基因表达,借鉴生物基因片段重叠表达,引入重叠基因概念,节约了表达空间;(c)回溯进化,借鉴生物“返祖现象”,引入回溯检查点概念和可回溯GEP算法、设计了等比递增检查点序列和加速递增检查点序列,约束回溯过程。实验表明,三项技术在一定的场合下分别提高了知识发现的性能1至2个数量级。
相关文章 | 多维度评价